InPhyRe: Grandes modelos multimodales fallan en razonamiento físico inductivo
Descubre el nuevo benchmark InPhyRe revela: modelos multimodales fallan en razonamiento físico inductivo, cuestionando su fiabilidad en aplicaciones críticas.
Descubre el nuevo benchmark InPhyRe revela: modelos multimodales fallan en razonamiento físico inductivo, cuestionando su fiabilidad en aplicaciones críticas.